Ние сме новите Gremlins в машината AI

Един от моите родственици чу някои странни истории, когато работих върху телефонна линия за опазване на здравето по време на пандемията на Covid. Нейната работа беше да помогне на обаждащите се да завършат бързите проби за непряк поток, употребявани милиони пъти по време на блокиране. Но някои обаждащи се бяха ясно комплицирани от процедурата. " Значи, аз пия течността в тръбата. Какво да върша в този момент? " Попитан.

Понякога тази корист може да бъде съзнателно, за по -добро или по -лошо. Например, репортерите на организацията на акцията без граници се опита да отбрани свободата на словото в няколко властнически страни, като скри неразрешено наличие на сървъра за видеоигри Minecraft. Междувременно нарушителите употребяват домашни 3D принтери за произвеждане на непроследими пушки. По -често обаче злоупотребата е неволна, както при тестванията на Covid. Наречете го разсеян проблем за корист или „ IMP “ за малко. Новите Gremlins в машините може да са IMPS в чатботите.

Вземете чатботите с общо предопределение, като Chatgpt, които се употребяват от 17 на 100 от американците най-малко един път месечно за самодиагностициране на опасенията за здравето. Тези чатботи имат невероятни софтуерни благоприятни условия, които биха изглеждали като магия преди няколко години. По отношение на клиничните познания, триажът, обобщаването на текст и отговорите на въпросите на пациента, най -добрите модели към този момент могат да подхождат на човешките лекари, съгласно разнообразни проби. Преди две години, да вземем за пример, майка в Англия сполучливо употребява Chatgpt, с цел да разпознава синдрома на Tethered Cord (свързан със Spina bifida) в сина си, който е бил пропуснат от 17 лекари.

, който покачва вероятността, че тези чатботи могат един ден да станат новата „ входна врата “ за доставка на здравни грижи, подобрявайки достъпа на по -ниски разноски. Тази седмица Уес Стрийт, министърът на опазването на здравето на Обединеното кралство, даде обещание да надгради приложението NHS, употребявайки изкуствен интелект, с цел да даде „ доктор в джоба ви, който да ви преведе през вашата грижа “. Но методите, по които те могат най -добре да се употребяват, не са същите като това, по какъв начин се употребяват най -често. Скорошно изследване, ръководено от Интернет института в Оксфорд, акцентира някои тревожни дефекти, като потребителите се борят да ги употребяват дейно.

Изследователите записаха 1298 участници в рандомизирано, следено изпитване, с цел да ревизират какъв брой добре могат да употребяват чатботи, с цел да отговорят на 10 медицински сюжета, в това число остри главоболия, счупени кости и пневмония. Участниците бяха помолени да разпознават здравословното положение и да намерят предложен курс на деяние. Използвани са три чатбота: GPT-4O на Openai, Llama 3 на Meta и Cohere's Command R+, които всички имат малко по-различни характерности.

Когато тестовите сюжети бяха въведени непосредствено в AI моделите, чатботите вярно разпознават изискванията в 94,9 на 100 от случаите. Участниците обаче се оправиха доста по -лошо: те предоставиха непълна информация и чатботите постоянно неправилно поясняват подканите си, което докара до спад на успеваемостта до единствено 34,5 на 100. Технологичните благоприятни условия на тези модели не се трансформираха, само че човешките входове го направиха, което докара до доста разнообразни изходи. По -лошото е, че участниците в теста също бяха превъзхождани от контролна група, която нямаше достъп до чатботи, само че вместо това се съветваха с постоянни търсачки.

Резултатите от сходни изследвания не значат, че би трябвало да спрем да използваме чатботи за здравни препоръки. Но това допуска, че дизайнерите би трябвало да извърнат доста повече внимание на това по какъв начин елементарните хора могат да употребяват услугите си. „ Инженерите са склонни да мислят, че хората употребяват технологията неправилно. Следователно всяка нередовност на потребителите е виновност на потребителя. Но мисленето за софтуерните умения на потребителя е от главно значение за проектирането “, споделя ми един създател на AI Company. Това е изключително правилно с потребителите, които търсят медицински препоръки, доста от които могат да бъдат обезверени, заболели или възрастни хора, показващи признаци на психологично утежняване.

Повече профилирани здравни чатове могат да оказват помощ. Въпреки това, неотдавнашно изследване на университета в Станфорд откри, че някои необятно употребявани лечебни чатботи, които оказват помощ за справяне с провокациите пред психологичното здраве, също могат да „ вкарат пристрастия и неуспехи, които могат да доведат до рискови последствия “. Изследователите допускат, че би трябвало да бъдат включени повече предпазители, с цел да се усъвършенстват потребителските подкани, да изискат интензивно информация, която да управлява взаимоотношението и да комуникира по-ясно.

Техническите компании и здравните снабдители също би трябвало да вършат доста повече проби на потребителите в условия в действителния свят, с цел да се подсигурява, че техните модели се употребяват по подобаващ метод. Разработването на мощни технологии е едно; Научаването по какъв начин да ги разпростира дейно е напълно друго. Пазете се от Imps.

Източник: ft.com